Model Selection

Multimodal visual encoding

# Multimodal visual encoding

Openvision Vit Large Patch14 84

OpenVision is a fully open, cost-effective family of advanced visual encoders focused on multimodal learning tasks.

Image Classification

Siglip2 So400m Patch14 224

SigLIP 2 is an improved multilingual vision-language encoder based on SigLIP, enhancing semantic understanding, localization, and dense feature extraction capabilities.

Featured Recommended AI Models

AIbase

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

© 2025AIbase